最好的Context Caching AI工具模型_精选Context Caching资讯

AI资讯

月之暗面 Kimi 开放平台「上下文缓存」正式公测长文本模型降本 90%

昨日，月之暗面旗下Kimi 开放平台宣布，上下文缓存（Context Caching）开始公测，该技术在 API 价格不变的前提下，可为开发者降低最高90% 的长文本旗舰大模型使用成本，并且显著提升模型的响应速度。

月之暗面 Kimi 开放平台将启动 Context Caching上下文缓存内测

Kimi 开放平台近日宣布，备受期待的Context Caching功能即将启动内测。这一创新功能将支持长文本大模型，并通过高效的上下文缓存机制，为用户提供前所未有的体验。据Kimi开放平台官方介绍，Context Caching是一项前沿技术，旨在通过缓存重复的Tokens内容，大幅度降低用户在请求相同内容时的成本。其工作原理在于智能识别并存储已处理的文本片段，当用户再次请求时，系统能够迅速从缓存中调取，从而极大提升了API的接口响应速度。

18.1k 昨天

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen3-coder-plus

Alibaba

输入tokens/百万

$16

输出tokens/百万

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

Qwen3-Next-80B-A3B-Instruct

Alibaba

输入tokens/百万

输出tokens/百万

256

上下文长度

Doubao-Seed-1.6

Bytedance

$0.8

输入tokens/百万

输出tokens/百万

256

上下文长度

Doubao-Seed-1.6-flash

Bytedance

$0.15

输入tokens/百万

$1.5

输出tokens/百万

256

上下文长度

Qianfan-VL-70B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Grok Code Fast 1

Xai

$1.4

输入tokens/百万

$10.5

输出tokens/百万

256

上下文长度

Hunyuan-T1-latest

Tencent

输入tokens/百万

输出tokens/百万

上下文长度

Doubao-Seed-1.6-vision

Bytedance

$0.8

输入tokens/百万

输出tokens/百万

256

上下文长度

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

输入tokens/百万

输出tokens/百万

256

上下文长度

GPT-5 nano

Openai

$0.35

输入tokens/百万

$2.8

输出tokens/百万

400

上下文长度

qwen3-coder-flash

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

月之暗面 Kimi 开放平台「上下文缓存」正式公测 长文本模型降本 90%

月之暗面 Kimi 开放平台将启动 Context Caching上下文缓存 内测

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

Qwen3-Next-80B-A3B-Instruct

Doubao-Seed-1.6

Doubao-Seed-1.6-flash

Qianfan-VL-70B

Grok Code Fast 1

Hunyuan-T1-latest

Doubao-Seed-1.6-vision

Qwen3-30B-A3B-Instruct-2507

GPT-5 nano

qwen3-coder-flash

月之暗面 Kimi 开放平台「上下文缓存」正式公测长文本模型降本 90%

月之暗面 Kimi 开放平台将启动 Context Caching上下文缓存内测